生成式对抗网络的研究进展与展望

阅读量:491
王飞跃

GAN:生成式对抗网络

生成式对抗网络(Generative Adversarial Networks, GANs)是古德费洛(Goodfellow)在2014年提出的一种采用对抗的思路来生成数据的思想。想象我们有两张图片,一张是真的,一张是假的。对人类而言,如何去判断这幅画究竟是伪造的还是真的?比如图1中,这幅赝作的问题在于“画中人”画得不对,不是人,而是一只兔子,所以可以认为它是假的。而对于伪造者,他会想:这里是该画人的地方,画得不对,以后在这个地方改进,就可以画出更真实的画。第二次,等他画好后,大家可能又会发现有另外的问题。这样循环迭代,不断改进,就可以提升生成器(即赝作画家)的水平。同时,侦探的水平也提高了。

GAN已在计算机图像生成等任务中取得了极大的成功。除此之外,GAN还涉及许多其他内容,例如关于加密与安全、机器人,甚至包括天体物理。GAN的发展方向正在不断深入和扩大,从传统的计算机视觉向其他领域扩展。乐昆(LeCun)在访谈中提到,对于深度学习,10年内最值得关注的一个想法就是GAN,因为这种方法使得许多以前不可能完成的任务成为了可能。

GAN的提出背景

智能的研究

在人工智能六十余年的发展历程中,相关的研究者大体可分为两个学派,即所谓的“纯净派(Neats)”和“邋遢派(Scruffies)”。“纯净派”认为要建立一个人工的智能系统,必须首先彻底地了解其形式上的特性,倾向于以数学,特别是数理逻辑为解析工具来研究人工智能,追求透明,且能证明因果关系的构造智能系统之理论与方法。而“邋遢派”则注重功能和效率,采用较为“进化”的观念,不太关心“证明”或“解释”,认为最重要的是干下去,先建立这样的“智能”实体再说,从最初的计算神经方法、启发式的智能程序设计、多智能体,到今天火热的深度学习和各种各样的计算智能方法。两派争论的焦点之一就是单纯的程序设计能不能作为人工智能的理论基础1。当然,长期以来,从理论上揭示智能的本质,在工程上建立智能机器,是所有人工智能研究人员的共同目标。

近年来,以深度学习为代表的“邋遢派”方法在语音分析、图像识别和自然语言处理等问题上取得了“纯净派”方法长期未能实现的突破,再加上大数据的热潮,引发大家对大数据和大计算驱动的人工智能方法的极大向往。问题是,大数据从何而来?成本如何?又如何从数据走向智能?

一般来说,研究人工智能的出发点主要可分为两类。一类是从人类理解数据的角度去研究生成的东西。由于人类的经验是非常有限的,我们必须从某种数学或者现实中能够感受到的直观例子去学习。做生成模型时,我们会预先设定一个分布(比如高斯分布),假设图像符合这个分布,只是参数的分布未知,我们可以通过数据去拟合这个分布。另一类是让机器或模型直接去理解这个数据,我们对数据不进行假设,而是让一个模型生成数据,然后再判断这个数据究竟是对的还是错的,是像真实数据一样,还是和真实数据相差太远,我们根据这个判断反复修正这个模型。以往的生成模型研究主要从人类理解数据的角度出发,希望使用一个显式的分布假设去设计模型。GAN可以说是第一个广为人知的,从机器或者数据的角度出发拟合数据的模型:我们不再给它任何的数据模型分布,而是直接去学习。


会员登录后可下载全文

中国计算机学会(CCF)拥有《中国计算机学会通讯》(CCCF)所刊登内容的所有版权,未经CCF允许,不得转载本刊文字及照片,否则被视为侵权。对于侵权行为,CCF将追究其法律责任。
<<< 下一篇 无
读完这篇文章后,您心情如何?

作者介绍

王飞跃

  • CCF杰出会员
  • 中国自动化学会副理事长兼秘书长,中科院自动化所研究员
  • 研究方向:智能控制、社会计算、平行系统、知识自动化等
  • feiyue.wang@ia.ac.cn